Тема 06. ПОКАЗНИКИ ВАРІАЦІЇ
Питання теми
Поняття про варіацію
Показники варіації та способи їх підрахунку
Правило додавання дисперсій
Основні терміни теми: розмах варіації, середнє лінійне відхилення, дисперсія, середнє квадратичне відхилення, коефіцієнт варіації, групова, міжгрупова дисперсія.
При вивченні явищ та процесів суспільного життя статистика вивчає варіацію ознак, які характеризують окремі одиниці сукупностей. Величини ознак варіюють під впливом різних причин та умов, що впливають на розмір даної ознаки, зростає його варіація.
Одна й та сама середня може характеризувати сукупності в яких розміри варіації ознаки суттєво відрізняються один від одного. Для всебічної характеристики рядів розподілу необхідні показники, що визначають міру, ступінь коливання окремих значень ознаки від середньої. Визначення варіації має важливе значення для характеристики сукупності, що вивчається та вирішення задач аналізу.
Для вивчення розміру варіації в статистиці використовують різні показники.
Найбільш простою мірою варіації є розмах варіації. Розмах варіації становить різницю між найбільшим і найменшим значенням ознаки
Величина показує, в яких межах коливається розмір ознаки, яка утворила ряд розподілу. Показник має вираження у тих самих одиницях виміру, що й варіанти. На розмах варіації впливають два крайніх значення ознаки. Тому цей показник може у деяких випадках невірно характеризувати варіацію ознаки. Розмах не відображає варіювання ознаки у основній масі одиниць сукупності.
Мірою варіації може слугувати середня з відхилень кожної окремої варіанти від їх середньої. Середнє лінійне відхилення являє собою середню з абсолютних значень відхилень окремих варіант від їх середньої: оскільки алгебраїчна сума відхилень індивідуальних значень ознаки від середньої дорівнює нулю, при обчисленні середнього лінійного відхилення беруться до уваги тільки абсолютні значення відхилень, без врахування знаків. Середнє лінійне відхилення є величиною іменованою і визначається в тих самих одиницях виміру, що й варіанти. Його обчислюють за такими формулами:
- просте середнє лінійне відхилення
- зважене середнє лінійне відхилення
Недолік середнього лінійного відхилення полягає у тім, що воно береться без врахування знаку. Тому в статистиці для характеристики варіації ознаки частіше використовують дисперсію та середнє квадратичне відхилення.
Дисперсія або середній квадрат відхилення становить середню арифметичну з квадратів відхилень значень окремих варіантів від їх середньої величини. Залежно від вихідних даних дисперсію обчислюють простою або зваженою середньою арифметичною.
- дисперсія проста
- дисперсія зважена.
Дисперсія має велике значення в аналізі. Однак її використання як міри варіації буває не зовсім зручним, оскільки розмірність дисперсії дорівнює квадрату розмірності ознаки, що вивчається.
Середнє квадратичне відхилення дорівнює квадратному кореню із дисперсії.
- середнє квадратичне відхилення просте
- середнє квадратичне відхилення зважене
Розрахунок дисперсії та середнього квадратичного відхилення дозволяє усунути недолік середнього лінійного відхилення, тому, що будь-яке число взяте в квадрат буде числом позитивним.
Величина середнього квадратичного відхилення завжди більша ніж середнього лінійного. Це обумовлено тім, що в квадраті більші відхилення мають більшу вагу.
Відносну характеристику варіації можна надати за допомогою коефіцієнтів варіації та коефіцієнта осциляції. Коефіцієнт варіації є відношенням середнього квадратичного відхилення до середньої арифметичної величини в процентах. Чим менший коефіцієнт варіації тим менші коливання значень досліджуваної ознаки та навпаки.
Якщо взяти відношення середнього лінійного відхилення до середньої арифметичної в процентах, то отримаємо лінійні коефіцієнти варіації
Відношення розмаху варіації до середньої арифметичної в процентах називається коефіцієнтом осциляції
Найбільш розповсюдженим відносним показником коливання є коефіцієнт варіації. Розглянемо розрахунок показників варіації на прикладі
Таблиця 6.1
Групи робітників за рівнем місячного виробітку, тис. грн Кількість робітників, чол.. Середина інтервалу
24-26 4 25 100 11,84 35,05
26-28 10 27 270 9,60 9,22
28-30 7 29 203 7,28 7,57
30-32 3 31 93 9,12 27,72
32-34 1 33 33 5,04 25,40
Всього 25 699 42,88 104,96
тис. грн
Одним із спрощених способів розрахунку дисперсії є така її властивість: дисперсія ознаки дорівнює різниці між середнім квадратом варіантів ознаки та квадратом їх середньої.
Цей спосіб розрахунку дисперсії називається способом моментів. Розрахуємо дисперсію способом моментів за даними попередньої таблиці.
Таблиця 6.2.
25 4 625 2500
27 10 729 7290
29 7 841 5887
31 3 961 2883
33 1 1089 1089
Всього 25 19649
У ряді випадків виникає необхідність виміряти варіацію альтернативної ознаки. Позначимо відсутність ознаки, яка вивчається через 0, а її наявність – через 1, частку одиниць, які мають дану ознаку, - через , не мають цієї ознаки – через .
Тоді
Розрахуємо середнє значення альтернативної ознаки та її дисперсію.
Середнє значення альтернативної ознаки:
Дисперсія альтернативної ознаки
Отже дисперсія альтернативної ознаки дорівнює добутку частки одиниць, які мають дану ознаку, на частку одиниць. які її не мають.
Середнє квадратичне відхилення:
Розглянемо розрахунок показників варіації на прикладі: в партії продукції 2 % становить брак.
Таблиця 6.3
1 0,02 0,02 0,98 0,9604 0,019208
0 0,98 0,00 -0,02 0,0004 0,000392
Разом 1,00 0,02 0,019600
На варіацію ознаки впливають різні причини, фактори. Вони поділяються на випадкові та систематичні. Тому варіація може бути випадковою й систематичною. Систематична варіація обумовлена дією постійних причин, факторів. Виникає потреба у визначенні випадкової та систематичної варіації, їх ролі у загальній варіації.
Загальна дисперсія характеризує загальну варіацію ознаки від впливу всіх умов, всіх причин, які обумовили цю варіацію.
Для визначення впливу постійного фактора на величину варіації використовують аналітичне групування. Виконують розподіл сукупності на групи та визначають як змінюється загальний результат від впливу фактора, який було покладено в основу групування. Варіація, яка обумовлена фактором, який покладено в основу групування має назву між групової.
Середня з групових дисперсій характеризує випадкову варіацію, яка виникає від впливу всіх факторів, окрім того, який було покладено в основу групування. Для визначення середньої з групових дисперсій необхідно спочатку розрахувати групові дисперсії по кожній групі, а після цього середню з них. Групові дисперсії можна визначити за такими формулами:
та
де - індивідуальні значення ознаки;
- групові середні;
- кількість одиниць;
- частоти або ваги.
На величину групових дисперсій не впливає групувальна ознака
Розглянемо розрахунок дисперсій за даними попереднього прикладу.
Таблиця 6.4. Розподіл 25 робітників за рівнем освіти:
Групи робітників за рівнем освіти Варіанти рівнів освіти Кількість робітників, чол.
Низький Неповна середня, середня 17
Високий Середня спеціальна, вища 8
Всього 25
Розрахуємо групові середні та дисперсії:
Таблиця 6.5. Групування робітників низького рівня освіти за рівнем виробітку
Групи робітників за рівнем виробітку, тис. грн.. Кількість робітників, чол..
24-26 (25) 4 100 -1,88 14,14
26-28 (27) 10 270 0,12 0,14
28-30(29) 3 87 2,12 13,48
Всього 17 457 27,76
Для цієї групи значення середньої величини виробітку та дисперсії:
Таблиця 6.6. Групування робітників високого рівня освіти за рівнем виробітку
Групи робітників за рівнем виробітку, тис. грн.. Кількість робітників, чол..
28-30 (29) 4 116 -1,25 6,25
30-32 (31) 3 93 0,75 1,69
32-34(33) 1 33 2,75 7,56
Всього 8 242 15,5
Для цієї групи значення середньої величини виробітку та дисперсії:
Середня з групових дисперсій характеризує вплив факторів крім факторної ознаки, яку було покладено в основу групування
Міжгрупова дисперсія (d) – це середньозважена з відхилень групових середніх.
Міжгрупова дисперсія характеризує коливання групових середніх біля загальної середньої (вплив фактора за ознакою якою виконано групування)
Таблиця 6.2
Групи робітників за рівнем освіти
Низький 17 26,88 -1,08 19,83
Високий 8 30,25 2,29 41,95
Всього 25 61,78
Правило додавання дисперсій
Загальна дисперсія дорівнює сумі середньої з групових дисперсій та міжгрупової дисперсії.
Загальна дисперсія виникає під впливом всіх факторів. Вона має дорівнювати сумі дисперсій, які виникають під впливом всіх інших факторів та дисперсії, яка виникає за рахунок фактора групування.
За допомогою закону додавання дисперсій, можна дати оцінку фактора, який покладено в основу групування в сукупності всіх факторів, які впливають на результативну ознаку.
Коефіцієнт детермінації
Кореляційне відношення
Кореляційне відношення характеризує щільність зв’язку між групувальною та результативною ознаками. Воно може змінюватись від 0 до 1.
Питання для самоперевірки
1. Від чого залежить розмір варіації
2. Для чого вимірюється варіація ознак
3. Показники варіації та способи їх підрахунку
4. Значення коефіцієнта варіації для економічного аналізу
5. Дисперсія альтернативної ознаки
6. Що показує між групова дисперсія?
7. Визначення внутрішньо групової дисперсії
Практичне значення правила додавання дисперсій